强化学习深入浅出完全教程

强化学习深入浅出完全教程
共23节 10965人在学 课程详情
  • 强化学习概述

    • 强化学习概述
    • Python基础
    • Numpy基础
    • Gym环境介绍
    • 第一节作业
  • 马尔科夫决策过程

    • 马尔科夫决策过程(上)
    • 马尔科夫决策过程(中)
    • 马尔科夫决策过程(下)
  • 基于模型的动态规划方法

    • 马尔科夫决策过程示例编程
    • 基于动态规划的强化学习方法讲解
  • 蒙特卡罗方法

    • 基于动态规划的强化学习编程示例讲解
    • 理解基于蒙特卡洛的强化学习算法
    • 理解On-policy 和 off-policy
  • Gym环境构建及强化学习算法实现

    • Gym 环境构建及强化学习算法实现
  • 值函数逼近方法

    • 函数逼近方法理论介绍
    • TensorFlow简介
    • 基于gym和TF的强化学习编程演示
  • DQN方法及其变种

    • 神经网络介绍
    • DQN算法及变种
    • DQN编程实例讲解
  • 策略梯度方法

    • 策略梯度理论知识讲解
    • 其他算法概述
  • 时间差分方法

    • 时间差分方法

    订阅失败

    强化学习深入浅出完全教程
    强化学习深入浅出完全教程 ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    播放页问题反馈
    视频学习中有任何产品建议都可由此反
    馈,我们将及时处理!

    课时介绍

    强化学习概述-强化学习概述强化学习深入浅出完全教程

    课程介绍

    深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。 强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
    推荐课程

    信息系统项目管理师自考笔记

    李明 · 853人在学

    python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

    王先生 · 22570人在学

    手把手搭建Java超市管理系统【附源码】(毕设)

    汤小洋 · 4275人在学

    Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

    黄菊华 · 821人在学

    基于SSM酒店管理系统(毕设)

    小尼老师 · 882人在学

    java项目实战之购物商城(java毕业设计)

    Long · 5193人在学

    手把手搭建Java求职招聘系统【附源码】(毕设)

    汤小洋 · 1522人在学

    Python Django 深度学习 小程序

    钟翔 · 2384人在学

    城管局门前三包管理系统+微信小程序(vue+springboot)

    赖国荣 · 657人在学

    Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

    李杰 · 4059人在学

    正在试验
    后自动删除环境
    课程实验
    本次实验时间已到期 00:00:00
    课件正在飞速打包中,请耐心等待几秒钟~